68 research outputs found

    Effects of language mismatch in automatic forensic voice comparison using deep learning embeddings

    Full text link
    In forensic voice comparison the speaker embedding has become widely popular in the last 10 years. Most of the pretrained speaker embeddings are trained on English corpora, because it is easily accessible. Thus, language dependency can be an important factor in automatic forensic voice comparison, especially when the target language is linguistically very different. There are numerous commercial systems available, but their models are mainly trained on a different language (mostly English) than the target language. In the case of a low-resource language, developing a corpus for forensic purposes containing enough speakers to train deep learning models is costly. This study aims to investigate whether a model pre-trained on English corpus can be used on a target low-resource language (here, Hungarian), different from the model is trained on. Also, often multiple samples are not available from the offender (unknown speaker). Therefore, samples are compared pairwise with and without speaker enrollment for suspect (known) speakers. Two corpora are applied that were developed especially for forensic purposes, and a third that is meant for traditional speaker verification. Two deep learning based speaker embedding vector extraction methods are used: the x-vector and ECAPA-TDNN. Speaker verification was evaluated in the likelihood-ratio framework. A comparison is made between the language combinations (modeling, LR calibration, evaluation). The results were evaluated by minCllr and EER metrics. It was found that the model pre-trained on a different language but on a corpus with a huge amount of speakers performs well on samples with language mismatch. The effect of sample durations and speaking styles were also examined. It was found that the longer the duration of the sample in question the better the performance is. Also, there is no real difference if various speaking styles are applied

    Beszélőazonosítás, hangbiometria rendvédelmi alkalmazása

    Get PDF
    Cikkem a beszéd alapján történő személyazonosítás tudományos alapjait, módszertanát, rendvédelemben betöltött szerepét, gyakorlati alkalmazását mutatja be. Tárgyalom a szakterülethez kapcsolódó elméletet, amelynek alapos ismerete a beszélőazonosítás végrehajtásához elengedhetetlenül szükséges. Gyakorlati példákon keresztül ismertetem az akusztikai-fonetikai (félautomatikus) és a biometrikus(automatikus) azonosítási módszer-tant. Végül a beszélőazonosítás szélesebb körű alkalmazási lehetőségeiről írok, amelynek segítségével a nemzetbiztonsági tevékenység, a bűnüldözés hatékonysága növelhető lenne

    Forensic authorship classification by paragraph vectors of speech transcriptions

    Get PDF
    In forensic comparison, document classification techniques are used mainly for authorship classification and author profiling. In the present study, we aim to introduce paragraph vector modelling (by Doc2Vec) into the likelihoodratio framework paradigm of forensic evidence comparison. Transcriptions of spontaneous speech recording are used as input to paragraph vector extraction model training. Logistic regression models are trained based on cosine distances of paragraph vector pairs to predict the same and different author origin probability. Results are evaluated according to different speaking styles (transcriptions of speech tasks available in the dataset). Cllr and equal error rate values (lowest ones are 0.47 and 0.11, respectively) show that the method can be useful as a feature for forensic authorship comparison and may extend the voice comparison methods for speaker verification

    A turizmus ágazat jelenlegi és potenciális éghajlati sérülékenységének területi különbségei Magyarországon = Territorial differencies in existing and potential climate vulnerability of the tourism sector in Hungary

    Get PDF
    A Magyar Bányászati és Földtani Szolgálat Nemzeti Alkalmazkodási Központ Főosztálya koordinálásában 2017 óta zajlik a Nemzeti Alkalmazkodási Térinformatikai Rendszer továbbfejlesztése projekt, amelynek C3 modulja a turizmus éghajlati sérülékenységének témakörét kutatta. A cikk célja a kutatás során kifejlesztett módszertan bemutatása a turizmus ágazat magyarországi éghajlati sérülékenységéről és annak kitettségi, érzékenységi, alkalmazkodóképességi dimenzióiról. A munkacsomag keretében a fogadóterületeket jellemző kitettségi, érzékenységi, alkalmazkodóképességi és éghajlati sérülékenységi mutatókat és területi különbségeket integráltan vizsgáltuk. A vizsgálat és a térképi ábrázolás a CIVAS modell lépésein haladt végig járási, három esettanulmány-régióban pedig települési léptékben, három időablakra: a jelenlegi állapot vizsgálata mellett a 2021–2050-es és a 2071–2100-es időszakokra. A három időablak mindegyikére két meteorológiai modell (EC-EARTH, CNRM-CM5) és az IPCC 5. értékelő jelentésében (AR5) az újabb generációs RCP (Representative Concentration Pathway) klímaváltozási szcenáriók közül kettő (RCP4.5, RCP8.5) alapján azonosítottuk a járási (az esettanulmányok esetében a települési) trendeket. Jelen vizsgálat jövőbeni kiterjesztésével várhatóan tovább mélyíthető a vizsgálat magyarázóereje és növelhető a hasznosíthatósága

    Situation Analysis of Organic Food Production with Qualitative Market Research

    Get PDF
    During past decade the general attitude of the population toward health, nutrition, quality and environment remarkably changed. Consequently ecological farming showed an upswing especially in developed countries. Due to growing demand, government subsidies and other economic advantages the cropping area increased and it will keep its pace in the near future. In Hungary the actors of economy have not fitted themselves to changed conditions. Main problem is the presence of quite a narrow domestic market resulting from a purchasing boom by western trading companies. In our survey the input, production and marketing aspects of organic farming were studied through interviewing farmers being involved into organic farming. results highlight the specific features of production in Hungary, its management relations, production structure and environment protectional considerations. As an overall goal it was set forth to identify the main limiting factors of domestic market growth, define the most marketable products and related companyforms. Producers´ opinion helped us with conducting the above process. Results of interviews were supported by our former experiences

    Obi-ugor morfológiai elemzők és korpuszok

    Get PDF
    Cikkünkben a végéhez közeled OTKA NF 71707 projekt keretein belül létrehozott obi-ugor számítógépes morfológiákat, annotált korpuszokat, a használatukat lehetvé tev webfelületet és azokat a problémákat mutatjuk be, amelyek a fejlesztés során felmerültek

    Diszkrét és konvex geometria = Discrete and convex geometry

    Get PDF
    R^3-ben n pont meghataroz legalabb const n^{77/141 -epsilon} tavolsagot (epsilon >0 tetsz.) R^3-ben n nem koplanaris pont (n>6 paratlan) meghataroz legalabb 2n-5 iranyt, es ez minden fenti n-re pontos. Egy racsteglatestnek, amelybe teljes n-es graf belerajzolhato, hogy a csucsok racspontok, es az elek mas csucson nem mennek at, minimalis terfogata const n^{3/2}. R^3-ben C^2 konvex testeknek korlatozott elszamu konvex poliederekkel torteno terfogatapproximaciojat visgaltuk, es erre aszimptotikus formulat adtunk. Minden harmadfoku graf egyenes elekkel sikba rajzolhato ugy hogy el nem tartalmaz mas csucsot, es az elek iranyai szama legfeljebb const. Az egysegkor veges sok konvex tartomanyra bontasa eseten ezek beirt korei sugarai osszege legalabb 1. R^n-ben egy 2 atlagszelessegu konvex test kore irt szimplex atlagszelessege legalabb akkora mint az egyseggomb kore irt szabalyos szimplexe. R^n-ben (n>1) ket konvex test, amelyek barmely kongruens peldanyainak metszete/uniojuk konvex burka centralszimmetrikus, kongruens gombok. Minden veges sikbeli ponthalmazban van Hamilton-ut, hogy egyik szog sem kisebb 20 foknal. R^n-ben 0-ra csillagszeru testet meghataroznak a linearis (n-1)-alterekkel valo metszetei teruletei es sulypontjai. Fix k-ra n pontu, gorbevonalakkal sikbarajzolt grafokra, amelyeknel nincs k paronkent metszo el, az elszamra a korabbiaknal sokkal jobb felso becslest adtunk. | In R^3 n points determine at least const n^{77/141-epsilon} distances (epsilon >0 arbitrary). In R^3 n not coplanar points (n>6 odd) determine at least 2n-5 directions, sharp for each above n. In R^3 lattice rectangular box, in which complete graph on n vertices can be drawn, vertices being lattice points, edges not containing other vertices, has minimal volume const n^{3/2}. In R^3 we investigated volume approximation of C^2 convex bodies by convex polyhedra with number of edges bounded above, gave asymptotic formula. Each 3rd degree graph can be drawn in R^2 with straight edges, no edge containing other vertices, number of directions of edges bounded. Decomposing the unit disc to finitely many convex domains, sum of the inradii is >= 1. In R^n average width of simplex, circumscribed to convex body of constant width 2, is >= that of regular simplex circumscribed to unit ball. In R^n (n>1) two convex bodies, intersection/convex hull of union of any congruent copies of which being centrally symmetric, are congruent balls. Finite set in R^2 has Hamilton line, each angle >= 20 degrees. In R^n body starlike w.r.t. 0 is determined by areas and barycentres of its sections with linear (n-1)-subspaces. We gave, for fixed k, for edge numbers of graphs with n vertices, drawn in R^2 with curvilinear edges, having no k pairwise intersecting edges, estimates from above, much better than earlier ones